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第 1 章 绪论 


在 重大 装备 实际 运行 过 程 中 ， 由 于 故障 样本 数量 较 少 ， 故 障 诊断 领域 也 面临 
着 小 样本 问题 的 挑战 。 小 样本 问题 在 故障 诊断 中 尤为 突出 ， 因 此 ， 如 何 有 效 地 利 
用 有 限 的 故障 数据 进行 准确 的 诊断 成 为 了 故障 诊断 领域 中 一 个 重要 的 研究 方向 。 

目前 ， 故 障 诊断 技术 已 经 发 展 到 多 种 不 同 的 层次 ， 包 括 利 用 数据 分 析 、 数 据 
处 理 、 数 据 挖掘 以 及 利用 人 工 智 能 技术 。 

深度 学 习 理 论 由 Hinton 等 人 引入 科学 界 ， 这 也 开启 了 一 个 全 新 的 智能 化 时 代 。 
随 着 时 间 的 推移 ， 深 度 学 习 的 学 习 算 法 不 断 进步 ， 它 的 学 习 特 征 、 模 型 结构 、 算 
法 规则 以 及 模型 之 间 的 相互 作用 ， 已 经 被 广泛 用 于 各 个 行业 ， 并 且 受 到 越 来 越 多 
的 关注 。 作 为 一 种 新 兴 的 机 器 学 习 技术 ， 深 度 学 习 具 有 许多 独特 的 特点 和 优势 。 
其 中 最 突出 的 三 个 特点 是 : 自 适 应 特征 提取 能 力 、 大 规模 数据 处 理 能 力 和 其 复杂 
的 网 络 结构 。 深 度 学 习 在 设备 故障 诊断 中 具有 很 大 的 优势 和 潜力 。 在 未 来 的 研究 
中 ， 需 要 进一步 探索 深度 学 习 在 设备 故障 诊断 中 的 应 用 ， 完 善 深 度 学 习 算 法 ， 提 
高 故障 诊断 的 准确 性 和 可 靠 性 。 

在 实际 生产 过 程 中 只 能 获得 非常 少 的 故障 数据 ， 这 就 导致 了 小 样本 问题 的 出 
现 。 如 果 不 能 有 效 地 利用 这 些 少量 的 故障 数据 ， 将 会 极 大 地 限制 对 机 器 故障 的 诊 
断 能 力 和 准确 性 ， 这 也 成 为 了 困扰 人 们 的 新 问题 ， 要 解决 这 个 问题 就 必须 生成 新 
的 故障 数据 。 

因此 ， 本 课题 研究 验证 了 基于 条 件 变 分 自 编 码 器 的 数据 生成 方法 ， 构 建 了 条 
件 变 分 自 编码 器 (Conditional Variational Auto-Encodef，CVAE) 数据 生成 网 
络 模型 ， 最 后 ， 基 于 相似 性 和 多 样 性 ， 对 重 构 信 号 进行 了 质量 检验 ， 并 对 生成 信 
号 的 故障 信息 进行 了 验证 ， 得 到 的 新 生成 的 故障 数据 可 以 提高 故障 信息 分 类 的 准 
确 率 ， 对 于 解决 小 样本 问题 具有 重要 的 意义 。 


第 2 章 基于 分 量 信 号 的 CVAE 数据 生成 网 络 构建 
2.1 变 分 自 编 码 器 
2.1.1 变 分 自 编码 器 网 络 结构 


VAE (Variational Autoencoder) 是 一 种 基于 神经 网 络 的 无 监督 学 习 方 法 ， 其 
核心 思想 是 学 习 数 据 的 潜在 分 布 ， 并 通过 采样 生成 新 的 数据 。VAE 通过 对 输入 数 
据 的 编码 和 人 解码， 来 间接 地 学 习 出 隐 变 量 的 分 布 。 具 体 来 说 ，VAE 的 编码 器 将 真 
实数 据 映射 为 一 个 潜在 空间 中 的 分 布 参数 ， 而 解码 器 则 将 潜在 变量 映射 回 到 原始 
数据 空间 中 。 在 这 个 过 程 中 ，VAE 还 引入 了 一 个 重 参数 化 技巧 ， 使 得 可 以 对 潜在 
变量 进行 采样 ， 从 而 更 好 地 训练 模型 。VAE 的 基本 结构 包括 编码 器 和 解码 器 两 个 
部 分 。VAE 结构 如 下 图 2-1: 


EE= === > 
推断 网 络 生成 网 络 
图 2-1 VAE 网 络 结构 图 
但 其 关注 的 不 仅 是 重 构 误 差 ， 还 包括 用 于 生成 数据 的 隐 变 量 ， 通 过 采样 生成 


新 的 数据 。 通 过 贝 叶 斯 公式 ， 可 以 推断 出 隐 变 量 Z 的 概率 分 布 ， 公 式 3-1 如 下 : 


P(X| 2)P(2) 
| P(X| 2Z)P(Z)dZ 


P(Z| X)= 


其 中 对 为 训练 数据 集 ，Z 为 隐 舍 变量 ，P(Z 1X) 为 已 知 了 XX 是 Z 的 概率 分 布 。 
采用 损失 函数 作为 指标 ， 可 以 有 效 地 比较 生成 的 样本 和 真实 样本 的 误差 ， 以 
此 作为 基础 ， 利 用 反 向 传播 算法 对 模型 进行 优化 ， 以 提高 预测 准确 性 。 


VAE 的 损失 函数 由 两 个 部 分 组 成 : 重建 损失 和 KL 散 度 损失 。 前 者 用 来 比较 
模型 预测 的 结果 与 实际 数据 之 间 的 差异 ， 而 后 者 则 用 来 比较 模型 预测 的 结果 与 实 
际 数据 之 间 的 差异 。 

重 构 损失 是 指 通过 解码 器 生成 的 样本 与 原始 样本 之 间 的 误差 ， 可 以 使 用 均 方 
误差 或 交叉 烂 来 计算 。KL 散 度 可 以 衡量 两 个 分 布 之 间 的 相似 度 ， 当 两 个 分 布 接 
近 时 ，KL 散 度 接近 于 0， 当 两 个 分 布 差异 越 大 时 ，KL 散 度 越 大 Bl。 因 此 ，VAE 
的 损失 函数 可 以 写作 重 构 损失 与 KL 散 度 损失 的 加 权 和 ， 其 中 权重 可 以 通过 超 参 
数 调整 。 通 过 最 小 化 这 个 损失 函数 ， 从 而 学 习 到 生成 样本 的 概率 分 布 ， 生 成 更 加 
真实 的 样本 。 损 失 函 数 公式 如 下 : 

Ps=R(N(wa)INGOD)+IIX- 站 

右 侧 第 一 项 为 隐 变 量 分 布 与 标准 正 态 分 布 间 的 KL 散 度 ， 右 侧 第 二 项 为 原始 

数据 X 和 生成 数据 间 的 重 构 损 失 。 
由 于 KL 散 度 的 损失 ， 生 成 的 样本 很 可 能 与 真实 样本 的 分 布 存在 较 大 的 差异 ， 
从 而 使 得 它们 很 难 被 准确 地 识别 出 来 。 因 此 ， 训 练 过 程 中 ， 应 该 尽量 保证 样本 的 
多 样 性 ， 以 便 获得 更 加 丰富 的 结果 。 

故 本 文选 取 有 特定 条 件 的 变 分 自 编码 器 ， 它 是 VAE 的 改进 版 。 


2.1.2 变 分 自 编码 器 特点 


VAE 是 一 种 无 监督 学 习 方法 ， 可 以 生成 具有 多 样 性 的 样本 ， 并 且 可 以 学 习 到 
数据 的 潜在 结构 ， 进 行 数据 压缩 和 降 维 。 它 可 以 通过 调整 潜在 空间 中 的 向 量 来 生 
成 具有 特定 属性 的 样本 ， 广 泛 应 用 于 图 像 生 成 、 图 像 编辑 等 领域 。 同 时 ，VAE 可 
以 控制 生成 样本 的 多 样 性 和 质量 ， 容 易 优 化 和 调整 ， 并 且 可 以 与 其 他 深度 学 习 模 
型 结合 使 用 ， 如 GAN， 以 获得 更 好 的 生成 效果 。 


2.2 条 件 变 分 自 编码 器 


2.2.1 条 件 变 分 自 编码 器 网 络 结构 


CVAE 是 一 种 基于 深度 学 习 的 生成 模型 ， 它 是 VAE 的 一 种 扩展 形式 ， 可 以 处 
理 具 有 条 件 属性 的 数据 。 其 核心 思想 是 使 用 编码 器 将 输入 数据 和 条 件 信息 一 起 映 


射 到 潜在 空间 中 的 分 布 ， 然 后 使 用 解码 器 将 潜在 空间 中 的 采样 和 条 件 信息 一 起 映 
射 回 输入 空间 。 其 结构 如 下 图 2-2 所 示 : 


图 2-2 CVAE 网 络 结构 图 

CVAE 的 结构 和 VAE 类 似 ， 但 是 在 编码 器 和 解码 器 中 加 入 了 条 件 信息 。 其 中 ， 
不 同 点 在 于 CVAE 的 编码 器 的 输入 是 数据 和 条 件 信 息 ， 输 出 是 潜在 空间 中 的 分 布 
参数 ， 解 码 器 的 输入 是 潜在 空间 中 的 采样 和 条 件 信息 ， 输 出 是 重 构 的 数据 。 在 训 
练 时 ，CVAE 网 络 可 以 学 习 到 数据 和 条 件 信 息 之 间 的 复杂 关系 ， 在 生成 数据 时 ， 
可 以 通过 调整 条 件 变 量 的 值 来 控制 生成 数据 的 特征 。 

此 外 ， 二 者 的 损失 函数 也 有 不 同 ， 在 VAE 中 ， 损 失 函 数 只 包括 重 构 误 差 和 
KL 散 度 ， 而 在 CVAE 中 ， 则 还 包括 条 件 焙 ， 这 样 保 证 了 生成 样本 的 多 样 性 。 

条 件 炉 是 指 在 给 定 某 个 条 件 下 ， 随 机 变量 的 不 确定 性 量度 。 具 体 来 说 ， 如 果 
有 一 个 随机 变量 X 和 条 件 变 量 Y， 则 条 件 粮 H(X|Y) 表 示 在 己 知 了 的 情况 下 , XX 的 
不 确定 性 。 其 公式 如 下 : 

H(X| Y)=—2p(x, y)*log(p(x| y)) 

其 中 ，p(x,y) 表 示 关 和 了 的 联合 分 布 ，p(x| y) 表 示 在 已 知 了 的 情况 下 ，X 的 
条 件 分 布 ，log 表示 以 2 为 底 的 对 数 。 

在 实际 应 用 中 ， 可 以 通过 调整 模型 的 超 参数 、 损 失 函 数 权重 等 方式 来 控制 条 
件 炉 的 大 小 。 通 常 可 以 尝试 不 同 的 参数 组 合 ， 并 通过 交叉 验证 等 方法 来 选择 最 优 
的 参数 。 因 此 ， 在 设计 CVAE 模型 时 需要 平衡 条 件 粹 和 其 他 损失 函数 之 间 的 关系 ， 
以 达到 最 优 的 生成 效果 。 


2.2.2 条 件 变 分 自 编码 器 特点 


本 文 的 目的 是 扩充 故障 样本 数据 ， 正 是 由 于 CVAE 可 以 通过 控制 输入 的 标签 
言 息 来 生成 不 同类 型 的 样本 ,可 以 生成 特定 标签 下 的 样本 ， 使 得 生成 的 样本 更 加 
有 具 有 针对 性 。 对 于 分 量 信 号 比较 多 、 信 号 比较 复杂 的 情况 ，CVAE 可 以 通过 输入 
数据 的 标签 信息 来 生成 不 同类 型 的 样本 ， 从 而 增加 生成 样本 的 多 样 性 ， 更 好 地 扩 
充 故障 样本 数据 。 


2.3 基于 一 维 振动 信号 的 CVAE 网 络 构建 


本 论文 中 采用 的 CVAE 模型 是 基于 Python 编程 软件 中 的 Keras 模块 实现 的 。 
其 中 ， 一 维 分 解 方法 对 应 的 编码 器 由 两 个 卷 积 层 和 三 个 全 连接 层 构 成 ， 解 码 器 由 
三 个 全 连接 层 和 两 个 卷 积 层 构 成 。 其 结构 图 2-3 如 下 : 


分 量 信号 “上 中 全 本 输入 层 < 一 | 类 别 标签 


采样 层 。 ”| 全 连接 层 x2 
| 卷 积 层 x2 

解码 层 全 连接 层 x3 
| 、 池 化 层 x2 

输出 层 。 | 化 > 生成 分 量 信号 


图 2-3 一 维 分 量 对 应 CVAE 网 络 结构 
本 模型 将 独 热 编 码 作为 类 别 标签 对 分 量 信号 进行 训练 。 独 热 编 码 是 一 种 将 离 
散 变 量 转换 为 连续 变量 的 方法 ， 可 以 将 离散 的 标签 信息 转换 为 一 个 向 量 ， 向 量 的 
长 度 等 于 标签 的 种 类 数 ， 每 个 维度 对 应 一 个 标签 ， 其 中 只 有 一 个 维度 的 值 为 1， 
其 余 维度 的 值 为 0， 表 示 该 样本 的 标签 是 哪 一 个 。 在 该 模型 中 ， 独 热 编 码 作为 标 
签 ， 来 控制 生成 的 样本 的 类 别 ， 从 而 保证 生成 样本 的 质量 。 


2.3.1 输入 层 


首先 对 分 量 信号 数据 的 行 和 列 分 别 进行 归 一 化 处 到 


E， 主 要 目的 是 加 速 网 络 的 


收敛 和 提高 网 络 的 稳定 性 ， 同 时 也 可 以 提高 网 络 的 泛 化 能 力 和 避免 梯度 消失 或 梯 
度 爆 炸 等 问题 。 其 归 一 化 公 


万 一 Xi 


Nom 一 
max 


\ 式 3-4 如 下 : 
(3-1) 


人 
x 表示 归 一 化 后 的 数据 。 


2.3.2 编码 层 


在 编码 器 结构 中 ， 编 码 器 的 第 


一 个 和 第 二 个 卷 积 层 都 使 用 了 64 个 大 小 为 25 
， 都 有 4 个 ， 这 种 编码 方法 可 以 有 


以 便 将 输入 数据 映射 到 洪 


的 卷 积 核 。 两 个 卷 积 层 的 池 化 窗口 尺度 都 相等 
效 地 提高 数据 的 准确 性 和 可 靠 性 。 然 后 随 着 Flatten 层 的 加 载 ， 三 维 张 量变 换 成 一 
维 向 量 ， 而 两 个 全 连接 层 则 被 划分 为 200 维 与 100 维 ， 
在 空间 中 。 其 参数 如 表 2-1 所 示 : 
表 2-1 编码 层 参 数 
参数 
和 卷 积 核 数量 
个 卷 积 层 卷 积 核 大 小 
Re 卷 积 核 数量 
第 一 个 卷 积 层 卷 积 核 大 小 
数量 
池 化 层 i 
第 一 个 全 连接 层 维度 
第 二 个 全 连接 层 维度 
2.3.3 采样 层 
采样 层 由 两 个 全 连接 层 构成 ， 


和 方差 ， 然 后 日 


以 及 一 


日 Lambda 函数 实现 


过 两 个 全 连接 层 计算 得 到 的 潜在 变量 的 均值 
， 其 结构 包括 潜在 变量 的 均值 、 方 差 两 个 输入 ， 


个 输出 潜在 变量 Z。Lambda dg ea, 然 
将 其 与 潜在 变量 的 均值 和 方差 计算 ， 得 到 的 值 结合 起 来 ， 
上 均值 得 到 最 终 的 潜在 变量 


和 量 Z。 


过 乘 以 标准 差 并 加 


2.3.4 解码 层 


其 解码 器 的 第 一 个 全 连接 层 和 编码 器 的 最 后 一 个 全 连接 层 的 维度 相同 ， 都 是 
200 个 。 然 后 是 三 个 全 连接 层 ， 维 度 分 别 是 400、800 和 1600， 用 于 将 潜在 空间 的 
句 量 解码 成 原始 信号 数据 。 最 后 两 个 卷 积 层 的 大 小 和 卷 积 核 个 数 与 编码 器 的 卷 积 


层 相 同 ， 都 是 64 个 大 小 为 25 的 卷 积 核 。 其 参数 如 下 表 2-2: 
表 2-2 编码 层 参 数 


参数 数值 

第 一 个 全 连接 层 维度 200 
第 二 个 全 连接 层 维度 400 
第 三 个 全 连接 层 维度 800 
第 四 个 全 连接 层 维度 1600 
第 一 个 卷 积 层 卷 积 核 数量 64 
人 卷 积 核 大 小 25 
A 卷 积 核 数 量 64 
全 卷 积 核 大 小 25 


2.3.4 输出 层 


输出 层 通 过 对 网 络 模型 中 的 数据 进行 编码 和 解码 ， 然 后 对 其 进行 反 归 一 化 ， 
最 终 将 处 理 结果 存储 起 来 。 首 先 将 生成 数据 从 一 维 数组 变 为 与 输入 数据 形状 形 同 
的 二 维 数组 。 接 下 来 ， 对 于 每 一 列 、 每 一 行 依次 进行 反 归 一 化 处 理 ， 得 到 反 归 
化 后 的 数据 。 其 反 归 一 化 公式 如 下 : 

X = XX (Xin — Xinin ) + Xnin 

其 中 ， 久 表示 归 一 化 后 的 数据 ，x, 和 xs 分 别 表示 数据 集中 的 最 小 值 和 
最 大 值 。x 表示 反 归 一 化 后 的 数据 。 

最 终 将 处 理 后 的 数据 保存 到 mat 文件 中 。 


2.4 基于 二 维 振动 信号 的 CVAE 网 络 构建 


与 一 维 分 量 不 同 ， 二 维 分 量 信 号 数据 集 为 四 维和 矩 阵 ， 数 据 大 小 不 同 ， 故 对 应 
的 CVAE 网 络 也 有 着 不 同 ， 其 结构 如 下 图 3-4: 


分 量 信号 输入 层 一 类 别 标签 
编码 层 国 
全 连接 层 x1 


采样 层 | 全 连接 层 x2 
全 连接 层 x1 
解码 层 
] 反 卷 积 层 x3 
输出 层 ”上 E- 化 放生 成 分 量 信号 


图 3-4 二 维 分 量 对 应 CVAE 网 络 结构 


2.4.1 输入 层 


二 维 分 量 的 数据 集 为 四 维 数据 ， 输 入 层 建 立 一 个 三 维和 矩阵， 将 四 个 分 量 数据 
集 的 同一 分 量 提取 出 来 ， 将 输入 数据 转换 为 可 供 网 络 模型 处 理 的 标准 化 数据 格式 。 
然后 通过 循环 将 这 四 个 数据 集中 的 二 维 分 量 数据 合并 成 一 个 二 维 数组 ， 并 使 用 归 
一 化 将 每 个 特征 的 数值 范围 缩放 到 0 到 1 之 间 ， 与 一 维 分 量 的 归 一 化 公式 相同 。 
归 一 化 后 ， 记 录 每 个 特征 的 最 小 值 和 最 大 值 ， 以 便 后 续 预 测 时 进行 逆 归 一 化 。 最 
后 ， 将 归 一 化 后 的 数据 重新 变 成 三 维 数组 。 同 时 ， 将 对 应 的 独 热 码 作 为 类 别 标签 。 
在 训练 过 程 中 ， 将 每 个 数据 样本 的 标签 作为 输入 的 一 部 分 ， 与 二 维 图 谱 数 据 一 起 
输入 到 神经 网 络 中 。 


2.4.2 编码 层 


编码 器 的 结构 由 两 个 卷 积 层 Conv2D 和 一 个 全 连接 层 Dense 组 成 。 第 一 个 卷 
积 层 的 作用 是 将 输入 的 二 维 分 量 数据 进行 特征 提取 ， 提 取出 数据 中 的 重要 特征 。 
第 二 个 卷 积 层 进一步 提取 特征 ， 并 将 特征 的 维度 降低 ， 从 而 减少 模型 的 参数 量 。 
然后 通过 一 个 全 连接 层 将 特征 展 平成 一 维 向 量 ， 并 将 其 映射 到 一 个 低 维 向 量 ， 表 
示 数 据 的 潜在 表示 。 这 个 低 维 向 量 的 维度 是 通过 参数 Latent dim 来 指定 的 。Relu 
激活 函数 被 广泛 应 用 于 编码 器 的 各 个 部 分 ， 特 别 是 卷 积 层 和 全 连接 层 ， 它 们 的 应 


用 可 以 显著 提升 模型 的 非 线 性 处 理 能 力 。 最 终 ， 编 码 器 的 输出 是 一 个 大 小 为 


Latent dim 的 低 维 向 量 ， 表 示 输 入 数据 的 潜在 表示 。 其 有 具体 参数 如 下 表 3-3: 
表 3-3 编码 层 参 数 
参数 数值 
卷 积 核 数量 8 
第 一 个 卷 积 层 卷 积 核 大 小 9 
激活 函数 Relu 
卷 积 核 数量 16 
第 二 个 卷 积 层 卷 积 核 大 小 9 
激活 函数 Relu 
Re 维度 16 
全 连接 层 激活 函数 Relu 
Latent dim 维度 3 
2.4.3 采样 层 


采样 层 由 两 个 完整 的 连接 层 组 成 ， 它 们 可 以 用 来 计算 潜在 变量 的 平均 值 和 方 
差 ， 并 使 用 Lambda 函数 来 处 理 这 些 信 息 。Lambda 函数 内 部 生成 一 个 标准 正 态 分 
布 的 随机 数 ， 然 后 将 其 与 潜在 变量 的 均值 和 方差 计算 ， 得 到 的 值 结 合 起 来 ， 通 过 
乘 以 标准 差 并 加 上 均值 得 到 最 终 的 潜在 变量 Z。 


2.4.4 解码 层 


解码 层 包 括 一 个 全 连接 层 、 三 个 反 卷 积 层 。 首 先 ， 潜 在 变量 Z 经 过 一 个 全 连 
接 层 ， 将 潜在 变量 表示 为 上 一 层 卷 积 层 输出 的 形状 。 然 后 ， 经 过 两 个 反 卷 积 层 ， 
将 其 转换 为 与 上 一 层 卷 积 层 输入 相同 的 形状 ， 并 逐渐 减 小 通道 数 。 最 后 ， 经 过 一 
个 输出 通道 数 为 1 的 反 卷 积 层 ， 输 出 训练 后 的 数据 。 最 后 一 层 的 激活 函数 为 
sigmoid， 它 的 作用 是 将 所 有 的 实数 值 映射 到 [0,1] 的 范围 内 。 这 样 ， 解 码 器 的 输出 


就 与 输入 数据 的 范围 相同 ， 方 便 后 续 的 比较 和 评估 。 其 参数 如 表 2-4 所 示 : 
表 2-4 解码 层 参 数 


参数 数值 

A 维度 16 

全 连接 层 激活 函数 Rl 

卷 积 核 数 量 16 

、 卷 积 核 大 小 9 
笃 __ 八 Ee 

第 一 个 反 卷 积 层 Kernel size 3 

激活 函数 Relu 


第 二 个 反 卷 积 层 卷 积 核 数量 8 


卷 积 核 大 小 9 


Kernel size 3 
激活 函数 Relu 
卷 积 核 数量 1 
第 三 个 反 卷 积 层 人 9 
Kernel size 3 
激活 函数 sigmoid 


2.4.5 输出 层 


输出 层 就 是 将 训练 好 的 数据 进行 反 归 一 化 处 理 ， 与 一 维 分 量 的 反 归 一 化 处 理 
方法 相同 。 然 后 将 输出 数据 进行 一 系列 的 调整 ， 将 其 形状 调整 为 与 输入 数据 的 形 
状 相 同 。 


2.5 CVAE 网 络 参 数 选 取 


模型 建立 之 后 ， 需 要 通过 不 断 训练 并 更 新 模型 参数 。 在 进行 训练 之 前 ， 需 要 
设置 一 系列 参数 。 参 数 也 需要 不 断 调整 ， 寻 找 最 优 值 ， 使 得 网 络 模型 的 生成 效果 
达到 比较 理想 的 程度 。 一 维 分 量 对 应 的 CVAE 网 络 模型 的 主要 参数 调整 如 下 : 

(1) 学 习 率 

学 习 率 在 神经 网 络 中 起 着 至 关 重 要 的 作用 ， 它 可 以 确定 目标 函数 是 否 可 以 达 
到 最 佳 状态 ， 并 且 可 以 预测 收敛 所 需 的 时 间 B。 

学 习 率 的 调整 从 较 小 值 逐 渐 增 大 ， 观 察 损失 值 的 变化 。 调 整 区 间 为 0.0001- 
0.01， 可 以 观察 到 刚 开 始 的 准确 率 较 低 且 不 稳定 ， 随 后 逐渐 增 大 ， 达 到 一 定 程 度 
后 再 次 下 降 。 当 损失 值 开始 收敛 并 且 不 再 有 太 大 的 波动 时 ， 可 以 认为 学 习 率 的 选 
择 比 较 合 适 。 

(2) epoch 

epoch 的 大 小 对 于 网 络 模型 的 性 能 有 着 重要 的 影响 。 如 果 epoch 太 小 ， 网 络 无 
法 充分 地 学 习 训 练 数 据 集 中 的 特征 ， 导 致 欠 拟 合 如 果 epoch 太 大 ， 网 络 可 能 会 
过 度 拟 合 训练 数据 集 ， 从 而 泛 化 能 力 下 降 。 

(3) 隐 变 量 

Latent dim 是 指 CVAE 网 络 中 的 潜在 空间 维度 。CVAE 网 络 模型 的 维度 越 高 ， 
模型 表达 能 力 越 强 ， 但 计算 也 会 更 加 复杂 ， 可 能 会 导致 过 拟 合 ， 导 致 泛 化 能 力 下 


降 。 当 维度 较 低 时 ， 模 型 的 表达 能 力 会 受到 影响 ， 这 将 使 得 计算 复杂 度 大 大 增加 ， 
从 而 使 得 模型 无 法 有 效 地 捕捉 到 数据 中 的 关键 信息 ， 从 而 导致 模型 的 性 能 大 幅度 
下 降 。 经 过 不 断 调 整 ， 最 终 将 Latent dim 大 小 确定 为 3。 
本 文 以 分 类 质量 检验 和 示例 验证 作为 性 能 指标 观察 模型 训练 结果 。 其 中 ， 两 
类 模型 参数 的 设置 如 下 表 2-5、2-6 所 示 : 
表 2-5 一 维 分 解 对 应 CVAE 模型 参数 汇总 


参数 数值 
Num classes 4 
Latent dim 3 
Batch size 40 
迭代 次 数 epoch 500 
学 习 率 Ir 0. 001 
卷 积 层 层 数 4 
池 化 层 层 数 6 
全 连接 层 层 数 4 


表 2-6 变 分 二 维 分 解 对 应 CVAE 模型 参数 汇总 


参数 数值 
Num classes 4 
Latent dim 昌 
Batch Size 30 
迭代 次 数 epoch 300 
学 习 率 Ir 0. 001 
卷 积 层 层 数 2 
反 卷 积 层 层 数 3 


全 连接 层 层 数 3 


第 3 章 基于 生成 信号 的 质量 检验 与 案例 验证 
3.1 生成 信号 质量 检验 
3.1.1 t-SNE 
t-SNE 是 一 种 高 效 的 非 线 性 降 维 技术 ， 能 够 将 高 维 空间 中 的 相似 点 映射 到 


低 维 空间 中 的 相 邻 点 ， 而 将 高 维 空间 中 的 不 相似 点 映射 到 低 维 空间 中 的 远离 点 


035] 。 


在 数据 可 视 化 中 ，t-SNE 可 以 帮助 识别 数据 中 的 聚 类 结构 和 相似 性 关系 。 
本 文采 用 的 两 种 分 解 方法 生成 信号 与 原 信 号 对 应 分 布 如 图 4-19、 图 4-20: 


信号 均值 t-SNE 可 视 化 
信号 均值 t-SNE 可 视 化 


少 


Ds 0 
~ -10 
-20 -20 


图 3-1 一 维 分 解 方法 图 3-2 变 分 二 维 分 解 方法 
以 上 两 张 图 显而易见 ， 变 分 二 维 分 解 的 方法 在 t-SNE 可 视 化 中 的 效果 好 于 
一 维 分 解 方法 。 


3.1.2 余 弱 相似 度 


余弦 相似 度 是 一 种 用 于 计算 两 个 向 量 之 间 相似 度 的 方法 ， 因 此 ， 余 弦 相 似 
度 检验 可 以 用 来 评估 生成 信号 与 原始 信号 之 间 的 相似 度 ， 从 而 判断 生成 信号 的 
质量 是 否 符合 要 求 。 在 本 论文 中 ， 可 以 将 原始 信号 和 生成 信号 看 作 两 个 向 量 ， 
然后 使 用 余弦 相似 度 来 计算 它们 之 间 的 相似 度 。 余 弦 相 似 度 的 计算 公式 如 下 : 
cos@=(A.B)/UIAIxXIIBID 


其 中 ，A 和 B 分 别 代表 两 个 向 量 ，: 表示 内 积 运算 ，1 4 1 和 18 1 表示 向 量 
的 模 长 。 余 弦 相 似 度 的 取 值 范围 在 -1 到 1 之 间 ， 值 越 接近 1 表示 两 个 向 量 越 相 
似 ， 值 越 接 近 -1 表示 两 个 向 量 越 不 相似 591。 

在 用 余弦 相似 度 检验 原始 信号 与 生成 信号 之 间 的 相似 性 时 ， 为 了 更 直观 的 
展现 生成 信号 的 效果 ， 本 文 将 原始 信号 与 自身 之 间 的 余弦 相似 度 和 原始 信号 与 
生成 信号 之 间 的 余弦 相似 度 的 图 像 放 在 了 一 张 图 里 ， 这 样 清晰 地 看 出 生成 信号 
的 质量 很 好 。 如 图 4-21、 图 4-22 所 示 : 


人 日 ， 
号 余弦 相似 度 
0.6 上 | 
0.5 上  ， 人 a , 1 
| MM | WW Ny | 川 | | 
0.4 7 [WN | | 
原 正 常 
03T 原 IR 
一 一 一 原 6-OR 
| 原 3-OR | 
Me 生成 正常 
生成 IR 
0.1 上 生成 6-OR 
生成 3-OR 
Or J 
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图 3-3 一 维 分 解 方 法 
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0.6 T T T 
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样本 区 间 
图 3-4 变 分 二 维 分 解 方法 


以 上 两 张 图 显而易见 ， 变 分 二 维 分 解 的 方法 在 余弦 相似 度 的 验证 中 好 于 一 
维 分 解 方法 。 


3.1.3 最 大 均值 差异 


MMD (Maximum Mean Discrepancy) 是 一 种 用 于 检验 两 个 分 布 之 间 相 似 度 
的 方法 ， 可 以 用 来 检验 本 文 的 原始 信号 和 生成 信号 之 间 的 相似 度 。 

MMD 的 计算 方法 是 通过 比较 两 个 分 布 在 特征 空间 中 的 期 望 值 之 间 的 差异 
来 判断 它们 之 间 的 相似 度 。 在 本 文中 ， 可 以 将 原始 信号 和 生成 信号 分 别 看 作 两 
个 分 布 ， 然 后 使 用 MMD 来 比较 它们 之 间 的 相似 度 。MMD 的 计算 公式 如 下 : 

MMD(P, Q) =||E(phi(x))—E(phi(y) | 2 

其 中 ，P 和 Q 分 别 代 表 两 个 分 布 ，phi(x) 和 phi(y) 分 别 表示 将 信号 x 和 y 了 映 
射 到 特征 空间 中 的 函数 。|| * | 表示 向 量 的 模 长 ，E(。) 表 示 期 望 值 。 

MMD 的 取 值 范围 在 0 到 正 无 穷 之 间 ， 值 越 接 近 0 表示 两 个 分 布 越 相似 ， 反 
之 则 说 明 它 们 之 间 的 差异 越 大 。 两 种 分 解 方 法 原 信号 与 生成 信号 的 最 大 均值 差 
异 如 下 图 4-23、 图 4-24 所 示 : 


MMD 距 离 


1| 0.02857 WA 0.1789 0.193 0.04603 Lab 0.1729 


2 以 EU 0.02857 AE 0.1979 0.1908 0.1581 0.1929 0.1877 
kj 0.1789 mk: 0.02857 Ai:L4 0.1778 0.1955 0.1689 0.1963 
0.1979 (oT 0.02857 MEKK 0.1925 0.1938 0.174 


0.1908 0.1778 0.1933 0.1714 0.174 
0.1581 0.1955 0.1925 0.1714 0.1787 0.1669 
0.1929 0.1689 0.1938 0.1787 0.1754 
0.1877 0.1963 0.174 0.174 0.1669 0.1754 


图 3-4 一 维 分 解 方 法 


MMD 距 离 


| ).202 0.202 
2 0.202 At 0.02857 
3 0.202 0.202 0.2008 0.202 0.202 0.202 0.202 
长 0.202 0.202 0.2008 0.202 0.202 0.202 0.202 
GE 0.2019 0.2019 0.202 0.202 0.202 0.202 0.2019 
[0.1998 0.1998 0.202 0.202 0.202 0.202 0.1998 
7 7 0.202 
8 |0.02857 0.202 0.202 0.2019 0.1998 0.202 


样本 
图 3-5 变 分 二 维 分 解 方法 
上 图 横 坐 标 1-4 代表 四 个 原始 样本 ，5-8 代表 生成 的 样本 ， 由 图 可 知 ，1 与 
5 进行 对 比 ，2 与 6 进行 对 比 ， 以 此 类 推 ， 可 见 通过 最 大 均值 差异 来 检验 相似 性 ， 
分 解 这 种 方法 要 略 优 于 变 分 二 维 分 解 。 


3.2 案例 验证 
3.2.1 小 样本 条 件 下 故障 信息 分 类 准确 率 


在 故障 诊断 领域 中 ， 由 于 样本 数量 较 少 ， 故 障 识 别 准确 率 可 能 会 受到 一 定 
的 影响 。 这 个 问题 在 实际 应 用 中 比较 常见 ， 因 为 故障 数据 的 获取 比较 困难 。 同 
时 ， 由 于 各 种 类 型 的 故障 数据 的 差异 ， 以 及 “学 习 ” 中 未 曾 接触 的 信息 ， 使 得 
模型 的 训练 效果 无 法 达到 理想 的 水 平 ， 从 而 引发 了 过 拟 合 、 欠 拟 合 以 及 其 他 各 
种 误差 ， 从 而 严重 损害 了 故障 识别 的 精度 。 

为 了 模拟 实际 过 程 中 的 小 样本 问题 ， 分 别 将 三 类 故障 原始 样本 数量 设置 为 
10、30、50， 分 别 代入 故障 信息 分 类 模型 中 ， 得 到 了 三 类 状态 信息 分 类 的 准确 
率 如 图 4-31、32、33: 


各 类 样本 数量 均 为 10 的 条 件 下 四 类 样本 故障 分 类 准确 率 
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图 3-6 各 类 样本 数量 为 10 的 条 件 下 三 类 状态 的 故障 信息 分 类 准确 率 
各 类 样本 数量 均 为 30 的 条 件 下 四 类 样本 故障 分 类 准确 率 
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图 3-7 各 类 样本 数量 为 30 的 条 件 下 三 类 状态 的 故障 信息 分 类 准确 率 
各 类 样本 数量 均 为 50 的 条 件 下 四 类 样本 故障 分 类 准确 率 
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图 3-8 各 类 样本 数量 为 50 的 条 件 下 三 类 状态 的 故障 信息 分 类 准确 率 


由 分 类 结果 可 知 ， 样 本 数量 越 少 ， 每 种 故障 分 类 的 效果 就 越 不 理想 ， 整 体 
三 类 故障 的 分 类 情况 也 不 理想 ， 通 过 利用 全 部 的 原始 样本 ， 最 终 将 三 类 的 故障 
分 类 准确 率 由 43.3% 提 高 到 了 84.7%， 但 这 还 是 达 不 到 实际 工程 理想 的 效果 。 


3.2.2 样本 充足 条 件 下 故障 信息 分 类 准确 率 


为 了 验证 本 文生 成 的 数据 故障 信息 ， 本 文 将 两 种 方法 各 生成 的 三 类 样本 和 
原始 样本 作为 输入 样本 ， 其 中 正常 状态 样本 及 其 他 两 类 样本 数量 均 为 130， 带 
入 到 故障 信息 分 类 的 模型 中 ， 这 样 就 模拟 了 样本 充足 的 条 件 ， 得 到 了 三 类 状态 
言 息 分 类 的 准确 率 为 98.3%， 各 类 状态 信息 具体 分 类 的 准确 率 如 图 4-34: 
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准确 率 


图 3-9 样本 充足 条 件 下 四 类 样本 的 故障 信息 分 类 准确 率 
由 图 可 知 ， 两 种 方法 得 到 的 生成 样本 均 能 有 效 反 映 出 原始 样本 中 的 故障 信 
轧 ， 证 明了 本 文 的 可 行 性 。 同 时 也 反映 了 故障 样本 充足 的 条 件 下 ， 故 障 信息 分 
类 的 准确 率 也 会 大 大 提高 ， 验 证 了 本 论文 的 CVAE 网 络 模型 的 可 靠 性 。 


